ความล้มเหลวของการแม่นยำ
แม้ว่าพหุนามดีกรีสูงจะสามารถผ่านจุดข้อมูลทุกจุดได้ แต่มันมักจะก่อให้เกิดการสั่นสะเทือนแบบ 'รันเก' ซึ่งการสั่นนี้ไม่เกี่ยวข้องกับกระบวนการทางกายภาพที่แท้จริงเลย ดังนั้นจึงไม่สมเหตุสมผลที่จะต้องการให้ฟังก์ชันการประมาณค่าตรงกับข้อมูลอย่างแม่นยำโดยเฉพาะอย่างยิ่งเมื่อการวัดค่ามีความแปรปรวน
การกำหนดการพอดีที่ดีที่สุด: สามมาตรฐาน
เพื่อการประมาณค่า เราจำเป็นต้องนิยามฟังก์ชันความคลาดเคลื่อน $E$ การวัดความใกล้เคียงของเราจะเปลี่ยนผลลัพธ์อย่างสิ้นเชิง
ต้องการลดความคลาดเคลื่อนสูงสุดให้น้อยที่สุด:
$$E_{\infty}(a_0, a_1) = \max_{1 \le i \le n} \{|y_i - (a_1 x_i + a_0)|\}$$
จุดอ่อน: แนวทางมินิมัมมักให้ความสำคัญกับข้อมูลบางส่วนที่ผิดพลาดมากเกินไป
ผลรวมของค่าความแตกต่างแบบสัมบูรณ์:
$$E_1(a_0, a_1) = \sum_{i=1}^{n} |y_i - (a_1 x_i + a_0)|$$
จุดอ่อน: ฟังก์ชันค่าสัมบูรณ์ไม่สามารถหาอนุพันธ์ได้ที่ศูนย์ และเราอาจไม่สามารถหาคำตอบของระบบสมการนี้โดยวิธีเชิงวิเคราะห์ได้
มาตรฐานในวิเคราะห์เชิงตัวเลข ซึ่งใช้การยกกำลังสองของค่าความคลาดเคลื่อน:
$$E_2(a_0, a_1) = \sum_{i=1}^{n} [y_i - (a_1 x_i + a_0)]^2$$
สิ่งนี้สร้างพื้นที่เรียบและหาอนุพันธ์ได้ ทำให้การคำนวณเชิงอนุพันธ์หาค่าต่ำสุดทั่วโลกได้ง่าย
ข้อจำกัดเชิงวิเคราะห์
การเลือกมาตรการเป็นการสมดุลระหว่างตรรกะและคณิตศาสตร์ เช่น วิธีเบี่ยงเบนแบบสัมบูรณ์ไม่ให้ความสำคัญพอต่อจุดที่เบี่ยงเบนจากค่าประมาณอย่างมาก ในขณะที่ $L_2$ ให้จุดกลางที่แข็งแรง ซึ่งลงโทษค่าที่ผิดปกติมาก แต่ไม่ถูกควบคุมโดยจุดข้อมูลที่แปลกปลอมเพียงจุดเดียว